【小白学机器学习11】假设检验之2:Z检验(U检验,正态检验),Z检验量,Z分布,如何查表获得p值

您所在的位置:网站首页 u test要检测正态分布和方差齐吗 【小白学机器学习11】假设检验之2:Z检验(U检验,正态检验),Z检验量,Z分布,如何查表获得p值

【小白学机器学习11】假设检验之2:Z检验(U检验,正态检验),Z检验量,Z分布,如何查表获得p值

2024-07-12 11:58| 来源: 网络整理| 查看: 265

目录

1 什么是Z检验

1.1 Z检验的别名 Z-test /U-test / 正态检验

1.2 维基百科定义

1.2 百度百科定义

1.3 定义提炼关键点

1.4 Z检验量 : Z=(X-θ)/s = (X-u)/s

2 Z检验量的构造

2.1 Z检验量 : Z=(X_-u)/s

2.2 Z检验变量的构造

2.4 Z检验量的核心参数

2.4.1 原始公式

2.4.2 正式公式

2.4.3 核心参数

3 Z分布

3.1 Z分布的定义

3.2 Z分布与正态分布的比较

4  Z检验适用范围/ 情况

4.1 Z分布的适用范围/ 情况

4.2 Z检验的适用情况

4.3  具体适用范围/情况,比较的对象

4.3.1 单样本Z检验

4.3.2 两样本z检验

5 检验原理 

5.1 检验原理

5.1.0 建立h0建设和显著度α ,这个模型

5.1.1 先计算Z检验值

5.1.2 显著度α =置信度 =概率 =曲线下外侧面积

5.1.3 看要求得双侧还是单侧检验?

5.1.4 得到Z值后,联合显著度α, 查表得 查表Z值,然后比较

5.1.5 比较P值和α,然后判断

5.2 检验原理说明:自百度百科

6 Z检验得实际操作查表等

6.1 Z检验的边界值查表原理

6.2 计算Z检验:手动查表

6.2.1 先确定显著度水平 α

6.2.2 已知Z值和 α后,查表获得p值,然后进行比较

6.2.3 比较p和显著度水平 α

6.2.4 查表

7 例题

7.1 先确定检验方式:双样本Z检验

7.2 题目已知样本均值和方差

7.3 计算Z值

7.4 查表获得P值

7.4.1 第1个Z值查表p

7.4.2 第2个Z值查表p

8 参考文章等

1 什么是Z检验 也叫U检验,正态检验目的是:比较样本的平均值的差异,也可以叫 均值齐性检验前提假设,不同的样本都符合正态分布,标准正态分布?

1.1 Z检验的别名 Z-test /U-test / 正态检验 U检验 ,U-test正态检验

1.2 维基百科定义 Z检验,也称“U检验”,是为了检验在零假设情况下测试数据能否可以接近正态分布的一种统计测试。根据中心极限定理,在大样本条件下许多测验可以被贴合为正态分布。在不同的显著性水平上,Z检验有着同一个临界值,因此它比临界值标准不同的学生t检验更简单易用。当实际标准差未知,而样本容量较小(小于等于30)时,学生t检验更加适用。如果发现一个统计T接近于正态分配,Z检验的第二步为在零假设情况下估计T的期望值θ ,随后获得T的标准差s。在计算标准分数Z=(T-θ)/s后,单侧或双侧的p值可以用标准累积分布函数Φ来计算,分别为Φ(−Z)(左侧) Φ(Z)(右侧)和 2Φ(−|Z|) (双侧)。

1.2 百度百科定义 Z检验(Z Test)又叫U检验。由于实际问题中大多数随机变量服从或近似服从正态分布,U作为检验统计量与X的均值是等价的,且计算U的分位数或查相应的分布表比较方便。通过比较由样本观测值得到的U的观测值,可以判断数学期望的显著性,我们把这种利用服从标准正态分布统计量的检验方法称为U检验(U-test)

1.3 定义提炼关键点 这是一种利用服从标准正态分布统计量的检验方法要检测的变量符合正态分布 n~(u,δ) ,并不要求符合 标准正态分布 n~(0,1) , 因为很多样本都符合正态分布,所以适应性很广在不同的显著性水平上,Z检验有着同一个临界值,因此它比临界值标准不同的学生t检验更简单易用。当实际标准差未知,而样本容量较小(小于等于30)时,学生t检验更加适用。样本数量较大时,Z检验和T检验都可以,但是Z检验更简单好用。

1.4 Z检验量 : Z=(X-θ)/s = (X-u)/s U/Z与X的均值是等价的U/Z的分位数或查相应的分布表比较方便如果X符合正态分布,那么Z检验量= 标准分数Z=(X-θ)/s = (X-u)/s其中 u/θ 是均值,而s是样本的标准差std

2 Z检验量的构造 2.1 Z检验量 : Z=(X_-u)/s 简单公式:Z=(X_-θ)/s = (X_-u)/s U/Z与X的均值是等价的U/Z的分位数或查相应的分布表比较方便如果X符合正态分布,那么Z检验量= 标准分数Z=(X-θ)/s = (X-u)/s其中 u/θ 是均值,而s是样本的标准差std

2.2 Z检验变量的构造 此处公式里都不是Xi 而是 X_=average(X)因为Xi 符合正态分布  Xi ~N(u,δ)所以很显然,average(X) 也符合正态分布,average(X) ~N(u,δ/✔n)。 因为average(X)的均值还是u,而average(X)的波动肯定比Xi要小得多,所以方差肯定是降低了=δ/✔nZ检验量相当于构造了一个标准正态分布变量 Z=(X_-u) / (δ/✔n)~N(0,1)

2.3 下面是各种百科写的构造过程

Z检验量的构造  和 检验原理

2.4 Z检验量的核心参数 2.4.1 原始公式 Z=average(x)-u/δ有点像 标准化正态分布的公式,Zi=xi-u/δ ,但是这里用的不是xi而是均值average(x)但是要特意写成Z=average(x)-u/(δ/✔n) 原因?  就是✔n 是公式变换的结果,因为x ~ N(u,δ)  ,average(x) ~ N(u,δ/✔n)是只取了总体数里的n个样本,核心变量是 average(x),整个方法都是评价和比较的均值!!!,核心就是均值之间的差异

2.4.2 正式公式 Z检验要求大样本的原因,因为总体方差往往不可知,so需要一个大样本的样本方差)但是总体方差变不好获得,那总体均值就那么好得?Z检验的公式Z=(X_-u) / (δ/✔n)~N(0,1)Z=(X1_-X2_) / ✔(s1/n1+s2/n2)

2.4.3 核心参数 平均值 :      总体均值u  ,样本均值δ样本标准差:   s =std  或者双样本检测时  s1 和s2样本数量:     n,或者双样本检测时 2个 n1 和n2

3 Z分布 3.1 Z分布的定义 Z分布,全称费歇耳(Fisher)Z分布,亦称费歇耳方差比分布。从图形上看,特别像正态分布但是它是离散的,不是连续的

3.2 Z分布与正态分布的比较 Z分布是统计学中常用的一种离散概率分布,通常用于计算样本数据与总体均值之间的差异。它是通过将样本数据的均值与总体均值之差除以标准差来得到的。而正态分布是一种连续概率分布,具有钟形曲线形状,广泛用于自然现象和实验数据的概率分布。

4  Z检验适用范围/ 情况

Z检验是否合适先要看Z分布是否适用当下情况

4.1 Z分布的适用范围/ 情况 Z分布的准确性取决于样本数据的数量和总体分布的正态性。在样本数量较少或总体分布非正态时,Z分布的准确性会受到影响。Z分布的计算方法只适用于均值为整数且标准差为小数的情形。如果均值或标准差不是整数,或者样本数量较少,则需要使用其他计算方法。

4.2 Z检验的适用情况 n>30大样本情况,适合Z检验和T检验否则只适合T检验

4.3  具体适用范围/情况,比较的对象 4.3.1 单样本Z检验 单样本Z检验:比较一组样本和某数值(比如理想中的总体平均值)的平均值的差异原假设h0: average(x)=m

4.3.2 两样本z检验 两样本/双样本z检验,比较一组样本和另外一组样本数据的平均值的差异原假设h0: average(x1)= average(x2)

5 检验原理  5.1 检验原理 5.1.0 建立h0建设和显著度α ,这个模型 对比均值/差值对比:置信水平:95% 即对原假设H0有95%的把握假设检验,H0和h1

5.1.1 先计算Z检验值 Z检验的公式Z=(X_-u) / (δ/✔n)~N(0,1)Z=(X1_-X2_) / ✔(s1/n1+s2/n2)

5.1.2 显著度α =置信度 =概率 =曲线下外侧面积 显著度α 置信度概率曲线下外侧面积

5.1.3 看要求得双侧还是单侧检验? 单侧检验,右侧/左侧双侧检验如果是双边检验,就比较查表的 Z(α/2)如果是单边检验,就比较查表的 Z(α)

5.1.4 得到Z值后,联合显著度α, 查表得 查表Z值,然后比较 就是根据 显著度α, 比较 Z计算 Z(α/2) ,如果Z计算> Z(α/2) ,那就意味着Z太大,概率p Z(α/2) ,那就意味着Z太大,概率p


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3